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摘 要 文章 运用 文献 综述 与 调研 方法 ， 对 国外 主要 科研 资助 机 构 颁 布 的 数据 管理 计划 (DMP) 政 
策 进 行 了 调研 分 析 。 研 究 表明 ， 国 外 DMP 政策 主要 包含 数据 选择 与 标识 〈 包 括 数据 描述 、 数 据 版 权 、 元 
数据 标准 、 数 据 监 管 、 数 据 检 索 )、 数 据 存 储 与 保存 〈 包 括 存储 格式 、 存 储 地 点 、 存 储 期 限 、 数 据 备份 、 
数据 安全 )、 数 据 共 享 与 传播 〈 包 括 数 据 共享 、 权 限 管 理 、 伦 理 与 隐私 ) 等 内 容 。 建 议 未 来 在 国外 DMP 政 
策 的 基础 上 ， 通 过 实地 调研 ， 探 索 制 定 出 契合 我 国 国情 的 DMP 政策 。 

关键 词 ”数据 管理 计划 数据 描述 ”数据 保存 ”数据 共享 
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1 引言 

科研 数据 (Research Data) 是 数字 形式 的 研究 数据 ， 既 包括 可 存储 的 数字 式 数据 ， 也 包括 可 转换 成 数 
字 的 非 数字 式 数 据 ， 如 神经 图 像 、 勘 测 数据 、 仿 真 数据 等 止 。 由 于 数据 本 身 易 丢失 、 损 坏 ， 难 以 长 期 保存 ， 
且 多 数 科研 资助 机 构 有 数据 管理 方面 的 相关 要 求 ， 因 而 管理 科研 数据 成 为 科研 人 员 日 常 研究 活动 的 重要 组 
成 部 分 。 在 这 一 背景 下 ， 数 据 管理 计划 (Data Management Plan，DMP) 应 运 而 生 。DMP 是 一 份 详细 记录 
数据 管理 活动 ， 指 导数 据 管理 工作 的 纲领 性 文件 ， 能 够 为 科研 活动 中 的 数据 管理 提供 有 益 指 导 ， 使 各 项 数 
据 管 理 活动 遵循 良好 规范 所 。 制 定 一 份 高 质量 的 DMP， 将 能 使 科研 数据 的 创建 、 保 存 、 归 档 和 利用 有 章 可 
循 、 有 据 可 依 ， 同 时 也 能 保证 共享 、 重 用 和 长 期 保存 数据 的 一 致 性 、 准 确 性 与 可 追溯 性 中 。 
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随 着 数据 管理 热潮 的 兴起 ， 国 外 政府 部 门 、 科 研 院 所 、 基 金 会 等 科研 资助 机 构 陆续 出 台 了 一 系列 DMP 
政策 文件 。 美 国 国立 卫生 研究 院 (NIH) 要 求 从 2003 年 10 月 1 日 起 ， 所 有 向 NIH 申请 经 费 在 50 万 美元 
以 上 的 科研 人 员 都 必须 提交 一 份 数 据 共享 管理 计划 或 不 共享 数据 的 说 明 外 。 美 国 国家 科学 基金 会 《NSF) 
规定 ， 基 金 项 目 申报 者 在 2011 年 1 月 18 日 以 后 提交 项 目 申请 时 ， 需 提交 不 超过 两 页 的 标 有 “DMP” 的 补 
充 文件 ， 以 说 明 其 如 何 遵守 NSF 的 数据 共享 政策 四。 英国 高 校 更 重视 对 数据 管理 工作 的 指导 与 服务 ， 许 多 
大 学 要 求 科 研 人 员 使 用 数据 监管 中 心 (DDC) 研发 的 DMP Online 软件 对 数据 进行 管理 。2011 年 3 月 ， 
DDC 详细 给 出 了 DMP 文档 中 应 包含 的 八 项 核心 内 容 。 国 内 学 者 对 此 也 展开 了 积极 探索 ， 王 凯 等 探讨 了 
DMP 的 概念 ， 并 对 其 两 种 在 线 生成 工具 DMP Online 和 DMP Tool 进行 了 对 比分 析 外 ， 许 乌 等 总 结 了 Data 
One (Data Observation Network for Earth， 地 球 观 测 数据 网 ) 项 目 实 施 数据 监管 的 关键 流程 ， 指 出 制定 科学 
的 DMP 是 其 中 关键 一 环 ""; 陈 大 庆 则 对 英国 主要 科研 资助 机 构 的 数据 管理 政策 进行 了 调研 分 析 , 认为 DMP 
是 这 些 政策 中 明 待 补充 完善 的 内 容 趾 ， 杨 淑娟 等 从 数据 、 数 字 监 护 、 权 限 管 理 、 计 划 执 行 四 方面 对 英美 国 
家 基金 项 目 中 DMP 的 政策 内 容 进 行 了 松 述 ,以 期 为 我 国 的 基金 项 目 管理 与 图 书馆 服务 提供 指引 鄂 丽 君 
则 调研 了 国外 高 校 图 书馆 科研 数据 管理 教育 的 现状 ， 发 现 DMP 已 成 为 图 书馆 对 科研 人 员 进 行 教育 培训 的 
重要 内 容 %， 李 庆 娜 等 指出 数据 管理 是 临床 研究 质量 控制 的 关键 环节 ， 而 撰写 一 份 契 合 本 机 构 实 际 情况 的 
CN 高 质量 的 DMP 十 分 重要 rm 

随 着 对 DMP 理论 探讨 的 不 断 深入 ， 其 在 实践 应 用 方面 也 取得 快速 发 展 。 近 年 来 ， 英国、 美国 、 澳 大 
利 亚 等 国家 的 一 些 大 学 图 书馆 (如 爱丁堡 大 学 图 书馆 、 南 安 普 顿 大 学 图 书馆 等 都 已 经 把 开展 数据 管理 服 
务 作为 其 一 项 重要 业务 ， 其 内 容 包 括 对 科研 人 员 进 行 数据 管理 意识 、 知 识 和 技能 等 方面 的 培训 。 在 数据 管 
理 大 潮 的 冲击 下 ， 图 书馆 等 科研 服务 机 构 蝶 需 拓 展 新 业务 ， 开 发 新 的 服务 模式 来 避免 被 边缘 化 ， 而 主动 为 
科研 人 员 提 供 数据 管理 服务 是 其 面临 的 重要 发 展 机 遇 中 。 在 这 一 背景 下 ， 了 人 解 国外 科研 资助 机 构 的 DMP 
政策 有 助 于 图 书馆 等 科研 服务 单位 更 有 针对 性 地 开展 数据 管理 服务 工作 。 国 内 学 者 虽 对 DMP 政策 的 有 关 
内 容 进行 了 探讨 ， 但 这 些 探 讨 还 不 够 系统 、 深 入 ， 难 以 一 窥 DMP 政策 的 全 貌 。 为 此 ， 本 文 将 在 相关 研究 
的 基础 上 ， 对 国外 政府 机 构 、 高 校 、 基 金 会 等 科研 资助 机 构 的 DMP 政策 进行 系统 地 调研 分 析 ， 以 期 为 我 
国 科研 资助 机 构 与 服务 机 构 把 握 DMP 的 内 涵 实 质 ， 进 而 有 效 推动 国内 的 数据 管理 工作 提供 参考 。 

-二 2 研究 设计 

~ ”2.1 研究 框架 

根据 文献 调研 结果 ， 在 制定 DMP 时 ， 科 研 人 员 通 常会 面临 “ 存 什么 ”“ 怎 么 存 ” 以 及 “怎么 用 ”的 
问题 。 如 果 把 这 些 疑 问 转 化 为 系列 的 正式 研究 问题 ， 也 即 : 在 制定 DMP 时 ， 需 要 存储 哪些 数据 ?如 何 对 
这 些 数据 进行 组 织 描述 ? 在 数据 存储 、 备 份 与 长 期 保存 中 ， 需 要 考虑 哪些 问题 ? 如 何 传 播 与 共享 数据 ? 回 
答 这 些 问题 对 于 制定 科学 有 效 的 DMP 至 关 重 要 ， 因 而 需要 相关 的 政策 文件 予以 指导 。 本 文 在 开展 研究 时 ， 
参考 了 《前 瞻 导 论 动 政策 与 形 塑 未 来 》 一 书 0 第 二 章 “ 前 瞻 方 法 ”与 第 三 章 “ 跟 踪 扫 描 ” 中 提 到 的 
相关 研究 方法 ， 采 用 政策 观测 的 方式 ， 设 置 若干 政策 观测 重点 ， 并 据 此 设计 研究 框架 ， 将 制定 DMP 时 涉 
及 的 问题 分 为 3 大 部 分 ， 每 一 部 分 又 包含 若干 观察 子 问题 ， 有 具体 如 表 1 所 示 。 
表 1 国外 科研 资助 机 构 数据 管理 计划 (DMP) 政策 的 分 析 框 架 
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研究 问题 政策 观测 的 具体 内 容 
需 保存 哪些 数据 ?如 何 对 这 些 数 ”科研 活动 中 将 采集 或 创建 哪些 类 型 的 数据 ? 
据 进行 组 织 描述 ? 如 何 获取 第 三 方 数据 ， 包 括 数 字数 据 与 实体 数据 ? 


多 


数据 版 权 或 知识 产权 归 谁 所 有 ? 
采用 或 创建 怎样 的 元 数据 标准 ? 
可 确保 数据 质量 ? 

可 使 他 人 能 够 获取 、 理 解 并 重 | 


在 数据 存储 、 备 份 与 保存 中 
考虑 哪些 问题 ? 


ES 


wh 


在 共享 、 传 播 与 重用 数据 时 ， 需 


注意 哪些 问题 ? 


采用 哪些 数据 存储 格式 ? 


数据 ? 


如 何 进行 数据 备份 ? 

如 何 确保 数据 安全 ? 

如 何 进行 数据 的 长 期 保存 ? 
采取 何 种 数据 共享 策略 ? 
如 何 管理 数据 的 访问 权限 ? 
如 何 处 理 潜在 的 数据 伦理 及 隐私 问题 ? 


数据 存储 在 何 地 ? 是 否 有 特定 的 存储 条 件 要 求 ”? 


2.2 研究 对 象 


为 解决 上 述 问题 ， 笔 者 在 政策 调研 中 选取 了 若干 
澳大利亚 、 荷 兰 、 比 利 时 等 多 个 国家 ， 


来 自 美国 、 英 国 、 


居多 。 这 些 机 构 在 科研 数据 管理 方面 均 拥 有 


富 乡 验 ， 


具有 代表 性 的 科研 资助 机 构 进 行政 策 观 测 ， 这 些 机 构 
涵盖 政府 、 高 校 与 基金 会 三 类 机 构 ， 其 中 以 高 校 


拥有 较 强 的 影响 力 。 各 机 构 、 政 策 名 称 及 其 发 布 时 间 如 表 2 所 示 。 
表 2 国外 主要 科研 资助 机 构 数据 管理 计划 〈DMP) 政策 一 览 


机 构 名 称 

美国 地 质 勘探 局 (USGS) 
美国 国家 科学 基金 会 (NSF) 
美国 人 文 基金 会 (NEH) 
美国 校 际 社会 科学 数据 共享 联盟 (ICPSR) 
英国 经 济 与 社会 研究 理事 会 (ESRC) 
澳大利亚 国家 数据 服务 合作 中 心 (ANDS) 
荷兰 数据 归档 与 网 络 服务 协会 (DNAS) 
哥伦比亚 大 学 (COLUMBIA) 
根 特大 学 (RUG) 
剑桥 大 学 (CAMB) 
康 奈 尔 大 学 (CORNELL) 
莫 纳 什 大 学 (MU) 
纽卡斯尔 大 学 CNCL) 
悉尼 大 学 (USYD) 

本 研究 的 调研 时 间 为 2015 年 3 月 至 


] ,经 过 同年 6 月 至 7 


政策 名 称 
数据 管理 计划 要 点 检查 表 0” 
数据 管理 计划 1 
NEH 数字 人 文 办 公 室 数据 管理 
高 效 数据 管 理 计 划 指 南 0 
数据 管理 计划 : 同行 评议 人 员 指 南 5 
数据 管理 计划 531 
科研 数据 管理 计划 中 
数据 管理 计划 检查 表 中 | 
数据 管理 计划 2 
创建 数据 管理 计划 : 确定 计划 内 容 巴 | 
数据 管理 计划 撰写 指南 2 
科研 数据 计划 检查 表 呈 3 
数据 管理 检查 表 P9 
科研 数据 管理 计划 检查 表 户 ) 
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理论 研究 与 实践 探索 均 走 在 了 同行 前 列 ， 在 业界 


政策 发 布 时 间 
2015 年 3 月 更 新 
2011 年 1 月 发 布 
2014 年 7 月 发 布 
2013 年 6 月 发 布 
2012 年 10 月 发 布 
2011 年 8 月 发 布 
2012 年 4 月 发 布 
2014 年 4 月 发 布 
2015 年 2 月 发 布 
2010 年 10 月 发 布 
2013 年 5 月 发 布 
2009 年 8 月 发 布 
2011 年 6 月 发 布 
2012 年 7 月 发 布 


月 的 多 次 讨论 与 审核 修订 , 于 2015 年 8 


月 正式 完稿 。 以 下 根据 
3 数据 选择 与 标识 
3.1 


究 框 染 ， 


描述 数据 类 型 及 其 处 理工 具 、 方 法 等 


资助 机 构 DMP 政策 的 核心 


i 


[ne 


内 容 。 


在 DMP 中 ， 应 首先 对 科研 数据 进行 简要 描述 ， 这 几乎 是 所 有 科研 资助 机 构 的 一 臻 要求。 描述 内 容 主 
要 包括 数据 性 质 、 特 点 及 其 采集 或 创建 方法 、 流 程 、 工 具 ， 数 据 类 型 、 规 模 及 其 产生 速度 ， 数 据 的 分 析 、 
处 理工 具 或 软件 等 。 此 外 ，RUGP2 认 为 ， 如 需 收 集 敏感 数据 ， 还 应 对 其 必要 性 进行 解释 。 

在 描述 数据 概况 时 , 应 明确 数据 丢失 或 无 法 使 用 将 会 对 研究 工作 产生 怎样 的 影响 , 能 否 重新 生成 数据 ， 
还 应 考虑 数据 规模 及 其 对 数据 存储 、 共 享 与 传输 产生 的 影响 ， 数 据 可 能 面临 的 泄露 风险 等 问题 也 应 被 慎重 
考虑 。 
3.2 评估 、 描 述 拟 采用 的 第 三 方 数 据 

创建 新 数据 会 产生 成 本 问题 ， 因 而 科研 人 员 应 首先 考虑 当前 的 已 有 数据 能 否 继续 使 用 ， 例 如 出 版 物 、 
网 站 或 进度 报告 中 的 数据 等 。 如 需 使 用 第 三 方 数据 ， 则 应 考虑 这 些 数据 是 否 可 用 ， 能 和 否 获得 版 权 许 可 来 共 
享 数据 或 其 衍生 数据 。 此 外 ， 还 应 从 数据 内 容 、 来 源 、 使 用 规定 等 方面 对 其 进行 描述 ， 列 出 相关 引用 信息 ， 
如 本 地 入 藏 号 、DOI、URL 等 。 

科研 人 员 应 明确 所 需 数 据 的 所 有 可 能 来 源 ， 这 些 数据 是 否 有 访问 限制 及 其 将 如 何 影 响 数 据 存 储 、 访 问 
与 保护 ， 如 需 获 取 外 部 数据 ， 则 能 否 在 本 地 建立 数据 副本 ;， 若 数据 源 正在 更 新 ， 用 户 能 和 否 得 到 通知 或 必须 
手动 检查 ; 若 数 据 源 不 再 可 用 〈 如 网 站 不 复 存在 、 数 据 无 法 更 新 或 已 替换 为 更 新 版 本 等 )， 将 对 数据 获取 
产生 怎样 的 影响 。 上 述 问题 在 使 用 第 三 方 数 据 时 均 应 认真 考虑 。 
3.3 明确 数据 版 权 或 知识 产权 的 所 有 权 

科研 人 员 就 科研 数据 的 权 属 和 相关 法 律 问题 进行 明确 规范 ， 能 够 为 科研 数据 的 合理 合法 使 用 提供 重要 
依据 ， 因 此 多 数 科研 资助 机 构 都 在 DMP 中 强调 了 科研 数据 的 所 有 权 问 题 。 如 NSF03 强 烈 建议 ，DMP 中 除 
应 指明 数据 知识 产权 的 拥有 主体 外 ， 还 应 描述 如 何 保护 知识 产权 ， 注 明 所 有 的 版 权限 制 项 目 。ICPSR07 认 
为 ， 主 要 研究 人 员 和 其 所 在 机 构 拥 有 数据 版 权 。ESRCa 则 指出 ， 在 谈 及 数据 版 权 问题 时 ， 应 考虑 其 版 权 
许可 是 否 得 到 了 同意 或 阐明 ， 尤 其 当 研究 汇集 了 多 个 来 源 数据 时 。 
USYD2 对 科研 数据 的 版 权 归 属 进行 了 详细 规定 , 明确 了 以 下 5 种 情况 : 一 是 数据 创建 者 若 包 含 USYD 
的 研究 人 员 ， 则 数据 版 权 通常 属于 USYD; 二 是 数据 创建 者 若 为 其 他 机 构 雇佣 的 研究 者 ， 则 数据 版 权 
属于 研究 人 员 ， 先 前 男 有 约定 的 除外 ; 三 是 数据 创建 者 若 为 USYD 学 生 ， 则 数据 版 权 通 常 属 于 学 生 ; 四 是 
数据 创建 者 车 为 USYD 附属 机 构 ， 且 该 机 构 未 受 雇 于 其 他 机 构 ， 则 数据 版 权 属 于 该 附属 机 构 ; 五 是 数据 创 
建 者 若 为 USYD 附属 机 构 ， 且 该 机 构 受 雇 于 其 他 机 构 ， 则 数据 版 权 通常 也 属于 该 附属 机 构 ， 先 前 另 有 约定 
的 除外 ; 此 外 ， 还 存在 其 他 一 些 情况 ， 如 数据 创建 者 为 外 部 机 构 等 。 在 制定 DMP 时 ， 科 研 人 员 应 与 其 资 
助 或 合作 机 构 就 数据 权 属 做 出 明确 约定 ， 以 规避 数据 保存 、 共 享 与 传播 中 带 来 的 不 必要 争议。 
3.4 采用 或 创建 适用 的 元 数据 标准 

选用 或 根据 需要 创建 一 套 适 用 的 元 数据 标准 是 未 来 数据 发 现 与 共享 的 基础 。CAMB 乌 建议 可 使 用 都 柏 
林 核 心 集 和 文本 编码 倡议 〈TEI) 标准 来 实现 数据 互 操作 ， 此 外 还 可 采用 本 领域 当前 广泛 应 用 的 数据 描述 
标准 ， 而 受 控 词 汇 也 有 助 于 提高 数据 描述 的 一 致 性 。ANDSn9 指 出 ， 应 考虑 如 何 命名 数据 文件 ， 如 何 将 数 
据 组 织 到 文件 夹 中 , 如 何 管理 不 同 机 器 之 间 的 数据 传输 与 同步 , 以 及 如 何 跟踪 不 同 版 本 的 数据 文档 。NSF03 
强烈 建议 使 用 结构 化 或 标签 式 的 元 数据 标准 ， 如 XML， 该 格式 展示 灵活 、 机 器 可 读 且 易于 保存 。ICPSRI 
从 自身 角度 出 发 ， 认 为 元 数据 实体 应 依照 与 社会 科学 、 行 为 科学 和 经 济 科 学 最 相关 的 标准 来 制定 。 

在 选用 或 创建 元 数据 标准 时 ， 应 明确 何人 负责 创建 元 数据 ， 何 人 负责 更 新 元 数据 ， 若 无 适用 的 元 数据 
标准 ， 则 在 DMP 中 应 指明 这 一 点 ， 并 描述 所 使 用 的 补充 文档 。 此 外 ， 元 数据 存储 格式 以 及 是 否 采 用 不 同 
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格式 进行 数据 共享 或 


发 布 也 是 应 当 考 虑 的 问题 。 


3.5 制定 并 实施 有 效 的 数据 质量 监管 程序 


准确 的 、 高 质量 


的 数据 记录 是 科学 研究 可 信 的 前 提 ， 是 决定 项 目 效益 、 推 动 社会 进步 的 关键 。 在 数据 


监管 时 ， 应 考虑 如 何 


进行 数据 检查 和 认证 ， 是 外 部 认证 还 是 内 部 认证 (内 部 认证 需 由 数据 采集 者 以 外 的 人 


录 ， 是 否 依 据 原 始 数 
异常 值 、 核 对 图 表 数 
数据 采集 、 输 入 所 采 
在 数据 收集 、 数 据 录 


来 进行 )。 此 外 ， 还 应 考虑 质量 认证 是 否 在 数据 的 整个 生命 周期 中 都 在 进行 ， 是 否 对 认证 步 又 进行 了 记 


据 集 对 转录 数据 或 复制 数据 进行 了 错误 检查 与 审核 如 选择 随机 样本 进行 检查 、 寻 找 
据 和 制图 数据 等 )。ESRC08 指 出 ， 应 考虑 制定 科学 的 监管 程序 ， 包 括 数 据 验证 方法 ， 
用 的 标准 ， 遵 循 的 研究 实践 准则 ， 所 用 的 转录 模板 等 。 此 外 ， 还 应 确保 数据 质量 问题 
入 、 数 字 化 或 数据 检查 时 就 得 到 了 处 理 。 


3.6 提供 检索 数据 、 解 读数 据 的 辅助 信息 
在 DMP 中 可 制作 专门 的 文档 来 描述 数据 采集 方法 ， 解 释 数据 分 析 过 程 ， 介 绍 项 目 参与 者 与 任务 执行 


者 的 详细 信息 。 此 外 


， 还 可 列 出 项 目 实施 中 开发 或 记录 的 所 有 辅助 信息 ， 如 笔记 、 数 据 集 列 表 、 说 明文 件 


等 。MUC 认 为 ， 数 据 资产 列表 、 元 数据 标准 、 识 别 符 协 议 或 参考 编号 、 文 件 命名 协议 、 文 件 结构 协议 等 
都 有 助 于 他 人 理解 所 共享 的 数据 。 NCL29 建 议 ， 应 确保 描述 数据 组 织 及 其 所 有 辅助 信息 的 内 容 能 被 存储 起 
来 。NEH09 则 规定 ， 项 目 申请 者 应 在 DMP 中 描述 数据 格式 、 存 储 介 质 及 其 传播 方式 等 。 


在 数据 描述 时 ， 
可 发 现 性 ， 而 清晰 的 
据 也 非常 重要 7。 


采用 已 定义 的 规范 术语 、 令 词 表 和 关键 词 表 ， 有 助 于 提高 数据 的 易 懂 性 、 可 移植 性 与 
、 描 述 性 的 、 独 特 的 文件 命名 以 及 定义 明确 的 参数 单位 对 研究 者 查询 、 检 索 和 发 现 数 


4 数据 存储 与 保存 
4.1 选用 本 领域 通用 的 数据 存储 格式 


在 存储 数据 时 ， 
解释 原因 。CAMBC3 
储 格式 。MUP3 认 为 ， 


格式 来 保存 文档 。 注 


应 首先 明确 所 采用 的 存储 格式 ， 如 XML、SPSS、Word、Excel、AVI、NVivo 等 ， 并 
建议 ， 可 采用 当前 广泛 使 用 的 、 本 机 构 拥 有 相关 使 用 许可 的 、 正 成 为 本 领域 标准 的 存 
国际 或 国家 标准 机 构 认 可 的 、 本 领域 公认 的 最 佳 实践 标准 是 一 个 不 错 选择 。ICPSR"7 


则 建议 依照 现行 标准 和 实践 进行 数据 存储 ， 其 当前 以 ASCI 格式 存储 了 大 量 数据 ， 并 采用 XML 和 PDF/A 


意 ， 若 使 用 无 所 有 权 或 基于 开源 标准 的 数据 存储 格式 ， 则 应 事前 声明 ， 以 规避 数据 长 


期 开放 获取 可 能 带 来 的 风险 。 


4.2 描述 数据 存储 地 点 与 存储 环境 


存储 地 点 是 进行 数据 存储 必须 考虑 的 一 个 重要 问题 。USYDP 建 议 ， 数 字 式 数据 及 相关 副本 可 存储 在 


主题 或 领域 知识 库 、 
结束 之 后 安全 销毁 。 
些 机 构 提前 沟通 ， 以 
问题 ， 如 选择 开放 的 


USYD 学 术 知 识 库 、 各 院 系 网 络 硬盘 等 ， 亦 可 提交 给 本 人 所 在 教学 单位 ， 或 在 保留 期 
CAMBP3 认 为 ， 可 将 数据 存储 在 档案 馆 、 知 识 库 、 中 央 数 据 库 或 数据 中 心 ， 但 应 与 这 
明确 其 存储 标准 及 要 求 ， 若 无 法 找到 合适 的 存储 地 点 ， 则 应 处 理 好 数据 的 可 持续 利用 
存储 标准 ， 或 向 所 在 机 构 寻 求 支 持 。 


般 而 言 ， 科 
心 或 存储 库 中 ， 小 型 


数据 主要 有 三 个 存储 去 向 : 政府 或 专门 机 构 资 助 的 大 型 数据 一 般 存储 在 专门 的 数据 中 
研究 则 通常 将 数据 存储 在 机 构 库 或 科研 机 构 自 己 的 存储 系统 中 ， 还 有 部 分 数据 会 被 科 


研 人 员 直 接 存 储 到 本 


地 计算 机 或 硬盘 中 。 研 究 人 员 可 根据 数据 规模 及 项 目 要 求 自 行 选择 合适 的 存储 地 点 。 


此 外 ， 还 应 考虑 是 否 
据 、 文 献 及 其 他 项 目 


需要 将 数据 存储 于 特定 的 环境 中 ， 如 低温 、 低 湿 、 低 光照 的 条 件 下 。 对 于 非 数 字 式 数 
资料 ， 可 考虑 存储 在 学 校 、 院 系 、 机 构 或 部 门 的 安全 设施 中 。 一 些 资助 机 构 可 能 会 提 
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供 数据 存储 的 相关 费用 ， 这 一 因素 也 应 被 考虑 进来 。 
4.3 制定 并 实施 完善 的 数据 备份 策略 

数据 备份 是 确保 数据 安全 与 可 持续 利用 的 重要 保障 。 在 备份 数据 时 , 应 提供 数据 备份 频率 的 详细 信息 ， 
如 按 日 、 周 或 月 等 进行 备份 。 此 外 ， 还 应 明确 数据 备份 责任 人 ， 确 定 备份 数据 的 存储 地 点 ， 以 规避 设备 损 
坏 、 硬 件 失灵 、 数 据 丢 失 等 风险 。CORNELL5 建 议 ， 应 描述 备份 数据 时 使 用 的 硬件 、 存 储 环境 、 本 地 或 
外 部 服务 ， 并 可 尝试 将 这 些 服务 的 成 本 纳入 项 目 预算 。RUGP 认 为 ， 应 制定 合理 的 数据 备份 流程 ， 若 所 在 
部 门 或 研究 小 组 己 有 一 个 备份 程序 ， 则 可 参考 执行 。ESRCns 则 对 数据 备份 中 的 各 类 问题 进行 了 综合 考虑 : 
(1) 备份 程序 能 否 实现 备份 目的 ， 应 考虑 研究 涉及 的 所 有 机 构 的 备份 程序 、 备 份 频率 等 ，(2) 备份 是 否 
考虑 了 多 种 媒介 和 多 个 副本 ? (3) 是 否 考虑 了 备份 副本 可 用 性 的 检查 方法 ? (4) 是 否 给 出 了 信息 描述 机 
构 、 本 地 数据 中 心 的 备份 政策 ? 〈4) 如 需 采集 敏感 数据 ， 是 否 考虑 了 与 《数据 保护 法 案 》 相 符 的 保护 方 
法 ? 如 数据 加 密 、 匿 名 化 、 谨 慎 传 输 等 ，(5) 备份 策略 是 否 反 映 了 现 有 的 最 佳 实践 ? 〈6) 是 否 描述 了 版 

本 控制 方法 ? 即 确保 如 果 一 个 文档 中 的 信息 发 生变 化 ， 其 他 文档 中 的 相关 信息 也 发 生 相应 变化 ， 同 时 跟踪 
记录 多 个 版 本 及 其 存储 地 点 。 

> 在 备份 数据 时 ， 应 考虑 车 数据 被 存储 在 别处 ， 则 其 是 否 有 适用 的 备份 策略 ， 数 据 及 其 副本 是 否 以 不 同 
CN 媒介 被 存储 在 了 多 地 以 防 单 点 故障 ， 是 否 有 专人 监管 以 确保 备份 顺利 进行 ， 是 否 有 多 人 知晓 数据 存储 地 点 
及 其 访问 方法 ， 备 份 数据 将 被 保存 多 久 等 。 
4.4 明确 数据 管理 责任 人 及 其 监管 职责 

多 数 科研 资助 机 构 都 要 求 科研 人 员 给 出 数据 使 用 许可 协议 、 使 用 限制 、 保 密 性 或 相关 隐私 问题 等 的 处 
理 方案 以 确保 数据 安全 。 显 而 易 见 ， 若 研究 涉及 敏感 数据 ， 则 数据 安全 问题 将 变 得 更 为 重要 ， 这 既 适 用 于 
亏 数字 数据 文件 ， 也 适用 于 实体 数据 文件 ， 如 访谈 数据 、 血 液 样本 数据 、DVD 等 。COLUMBIA?" 认 为 ， 应 
CN 明确 三 个 问题 ， 一 是 何人 在 何 种 层次 上 控制 数据 ?二 是 数据 是 否 有 专门 的 隐私 或 安全 保护 政策 ? 三 是 数据 
全 ”是否 有 延迟 获取 的 时 间 段 ? NSFus 建 议 ， 在 DMP 中 应 描述 数据 技术 层面 、 程 序 层面 的 保护 方法 ， 包 括 如 
何 实施 数据 许可 、 权 限 限 制 、 延 迟 公开 等 。 

为 确保 数据 安全 ， 应 明确 数据 管理 责任 人 ， 如 首席 研究 员 、 数 据 管理 员 、 助 理 研究 员 等 ， 并 提供 其 详 
细 信 息 。 此 外 ， 还 应 指出 何人 负责 采集 项 目 实施 各 阶段 的 数据 文档 ， 可 通过 哪些 流程 确保 隐私 数据 得 到 保 
密 处 理 ， 在 何 地 存储 数据 副本 ， 如 何 保证 存储 安全 等 。 最 后 ， 是 否 还 有 其 他 影响 数据 安全 的 因素 还 需 数据 
管理 人 员 在 实践 活动 中 认真 考虑 。 
4.5 指明 拟 保存 的 数据 及 其 保存 期 限 

DMP 中 数据 保存 计划 的 具体 细节 除 与 数据 共享 策略 密切 相关 外 ， 还 取决 于 数据 存储 服务 提供 商 ， 如 
外 部 知识 库 、 数 据 中 心 或 出 版 商 等 。 一 般 而 言 ， 数 据 保存 计划 应 着 重 考虑 两 方面 的 问题 : 一 是 确认 相关 部 
门 、 机 构 或 项 目的 数据 保存 政策 及 其 对 数据 长 期 保存 的 影响 ; 二 是 明确 保存 的 数据 类 型 及 其 保存 期 限 .MUP 
认为 ， 以 下 6 种 数据 应 被 永久 保存 :1) 研究 具有 争议 性 ，(2) 研究 具有 广泛 关注 性 ，(2) 研究 中 首次 采 
用 了 创新 方法 ，(3) 研究 对 传统 范式 具有 挑战 性 ，(4) 研究 不 可 再 次 进行 或 再 次 进行 的 成 本 较 高 ，(5) 研 
究 具 有 长 远 价值 ，(6) 研究 能 够 支持 专利 申请 或 相关 知识 产权 活动 。 对 于 可 直接 验证 研究 结论 以 及 具有 重 
用 潜力 的 数据 也 应 重点 保存 。 此 外 ， 研 究 人 员 还 应 考虑 在 其 离开 某 一 领域 后 ， 如 何 确保 自己 的 数据 被 保留 
下 来 ， 这 对 数字 数据 与 实体 数据 都 适用 。 
除 上 述 问题 ， 还 应 考虑 如 何 保存 实体 数据 ， 如 野外 记录 德 、 地 图 等 ， 明 确 是 否 有 专人 负责 迁移 旧 的 过 
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时 格式 的 数据 ， 若 数据 文件 被 迁移 或 转换 ， 则 是 否 有 专人 来 核查 原件 及 转换 后 的 文件 ， 以 确保 数据 未 被 算 
改 或 丢失 。 数 据 清理 问题 ， 包 括 清理 哪些 数据 、 何 时 清理 、 怎 样 清理 等 也 应 被 纳入 DMP 中 。 
5 数据 共享 与 传播 
5.1 制定 科学 完备 的 数据 共享 计划 

调研 发 现 ，14 个 科研 资助 机 构 都 要 求 科研 人 员 共享 其 研究 数据 ， 并 在 DMP 中 表明 其 共享 意愿 、 共 享 
方式 等 。 为 此 ， 科 研 人 员 应 明确 是 否 进行 数据 共享 ， 如 果 共 享 ， 则 应 解释 如 何 共享 ， 与 何人 共享 ， 在 何 种 
条 件 下 共享 以 及 共享 时 可 能 面临 的 困难 等 。MUPs 将 数据 共享 策略 分 为 三 种 :一 是 不 共享 ， 仅 本 人 可 获取 
使 用 ， 二 是 内 部 共享 ，MU 的 员工 和 学 生 可 获取 数据 ;三 是 进行 外 部 共享 ， 如 向 其 他 机 构 等 提供 数据 。 此 
外 ， 对 于 特殊 数据 ，MU 认为 应 根据 其 具体 类 型 设置 共享 时 段 ， 如 成 年 人 心理 测试 或 干预 方面 的 数据 可 在 
该 研究 实施 7 年 后 共享 ， 包 含 临床 试验 的 医学 数据 可 在 15 年 后 共享 等 。CORNELL4 认 为 ， 应 指明 共享 的 
数据 内 容 及 其 所 处 阶段 ， 如 原始 型 ， 经 过 处 理 、 精 简 或 分 析 后 的 数据 等 。 此 外 ，DMP 中 还 应 ，(1) 描述 
共享 数据 所 采用 的 文件 格式 ， 应 选用 可 使 数据 得 到 最 大 重用 的 、 持 久 的 文件 格式 ， 如 有 必要 ， 将 目前 的 数 

据 格式 转换 为 这 些 格式 ，(2) 给 出 他 人 重用 数据 的 条 件 ， 描 述 数据 适用 的 许可 标准 及 其 他 使 用 条 款 ; (3) 
给 出 数据 的 存储 地 点 及 其 获取 方式 ，(4) 若 共享 第 三 方 数据 ， 则 应 介绍 该 数据 或 其 衍生 数据 能 否 共 享 ， 在 
ON 何 种 条 件 下 共享 ; (5) 指出 数据 所 有 者 与 数据 共享 责任 人 ; (6) 向 用 户 介绍 ， 当 前 的 数据 共享 策略 如 何 使 
他 们 将 数据 的 价值 最 大 化 。 
除 上 述 问 题 外 ，USGS64 指 出 还 应 考虑 数据 的 安全 性 或 敏感 性 问题 ， 如 不 能 立即 公开 数据 ， 则 应 给 出 
数据 共享 的 时 间 安 排 。ICPSRI7 则 把 科研 数据 广泛 提供 给 社会 科学 界 使 用 ， 包 括 可 公开 获取 的 、 限 制 获 取 
的 以 及 延迟 发 布 的 数据 文件 等 ， 并 针对 这 些 文件 制定 了 不 同 的 访问 策略 。ESRC0s 建 议 ， 应 认真 考虑 数据 
共享 面临 的 所 有 问题 及 其 解决 方法 ， 如 征求 受 访 者 的 共享 意见 ， 将 数据 匿名 化 或 清除 个 人 隐私 信息 后 再 共 
er 


2 ”对 数据 访问 权限 进行 有 效 管理 
数据 访问 是 数据 共享 政策 中 的 一 项 重要 内 容 ， 在 对 共享 数据 进行 管理 时 ， 应 明确 何人 拥有 数据 的 访问 
权限 ， 如 何 对 这 些 权限 进行 管理 。 对 于 敏感 数据 ， 应 采取 保密 措施 ， 制 定 正式 的 获取 与 使 用 规范 ， 保 护 其 
免 受 未 经 授权 的 访问 。 此 外 ， 在 DMP 中 还 应 对 所 有 有 权 访 问 共 享 数据 的 人 员 进行 介绍 ， 如 果 访 问 限 制 因 
数据 集 的 不 同 而 变化 ， 则 应 在 数据 共享 政策 中 澄清 这 一 点 。 最 后 ， 需 明确 其 他 研究 人 员 在 何 时 能 够 获取 数 
据 ? 在 项 目 实施 中 的 任何 阶段 , 在 研究 成 果 发 表 或 交流 之 后 , 抑或 在 一 定 的 迟 清 期 之 后 ,还 是 永 不 可 获得 。 
这 些 都 是 数据 访问 管理 中 应 考虑 的 问题 。 
5.3 正确 处 理 数据 中 的 伦理 及 隐私 问题 
科研 人 员 负 有 伦理 或 法 律 上 的 保密 义务 ， 包 括 保护 研究 对 象 的 隐私 ， 或 其 他 情形 下 要 求 的 安全 存储 及 
访问 限制 ， 例 如 可 能 阻止 数据 共享 的 许可 限制 等 。ICPSRI2 的 伦理 与 隐私 保护 内 容 包 括 两 项 : 一 是 知情 同 
意 , 即 对 于 特定 项 目 , 知情 同意 声明 将 不 包括 禁止 数据 在 研究 领域 内 共享 的 内 容 ; 二 是 信息 泄露 风险 管理 ， 
即 研究 项 目 在 将 数据 存储 在 ICPSR 之 前 ， 需 删除 其 中 的 所 有 直接 标识 符 ， 而 一 旦 进行 存储 ， 这 些 数据 将 经 
过 一 个 严格 的 处 理 程序 ， 以 保护 个 人 隐私 。NCL29 建 议 ， 数 据 管理 中 若 涉及 伦理 及 隐私 问题 ， 应 : 〈1) 介 
绍 数 据 中 敏感 、 机 密 或 受 保护 隐私 信息 的 管理 方法 ， 如 加 密 技术 、 密 码 限制 等 ，(2〉 提供 伦理 或 隐私 方面 
制约 科研 项 目 共 享 或 公开 研究 数据 的 事项 ;(3) 提供 数据 保存 、 隐 私 及 机 密 保护 方面 包含 参与 者 同意 信息 
的 详细 内 容 ; (4) 提供 保护 隐私 及 机 密 数 据 的 流程 或 步 又 信息 ， 如 匿名 化 处 理 等 ; (5) 提供 与 其 他 机 构 或 
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组 织 签署 的 数据 知识 产权 协议 方面 的 详细 信息 ， 如 协议 内 容 、 签 署 地 点 和 日 期 等 ，(6) 提供 数据 版 权限 于 
方面 的 信息 ; (7) 提供 数据 授权 方面 的 信息 ， 在 这 一 条 件 下 ， 数 据 可 以 被 重用 。 上 述 内 容 基 本 圳 括 了 数据 
管理 中 的 各 项 伦理 及 法 律 事项 ， 在 具体 的 实践 活动 中 可 根据 项 目 要 求 及 实际 情况 参照 执行 。 
6 结语 

根据 以 上 分 析 论 证 ， 本 文 认为 一 个 完整 的 DMP 应 包含 数据 选择 与 标识 、 数 据 存储 与 保存 、 数 据 共享 
与 传播 三 项 主要 内 容 ， 具 体 如 表 3 所 示 。 尽 管 DMP 在 科研 项 目的 概念 化 阶段 就 已 经 被 创建 ， 然 而 在 实际 


4 


应 用 中 其 还 需 不 断 更 新 完善 ， 以 便 在 项 目 生命 周期 的 各 个 阶段 都 能 为 科研 人 员 的 数据 管理 工作 提供 科学 有 
效 的 指导 。 
表 3 国外 科研 资助 机 构 DMP 政策 的 核心 要 点 
政策 观察 问题 要 点 
数据 选择 与 标识 。 描述 数据 类 型 、 采 集 或 创 ”描述 数据 采集 方法 、 数 据 类 型 、 数 据 规模 、 产 生 速 度 
建 方法 及 其 处 理工 具 或 软件 
获取 、 描 述 第 三 方 数据 ”评估 现 有 数据 ， 描 述 第 三 方 数 据 的 来 源 、 内 容 及 使 用 
规定 等 
明确 数据 版 权 或 知识 产权 ”指明 数据 版 权 所 有 者 ， 如 有 必要 ， 描 述 数 据 版 权 的 保 
护 方案 
采用 或 创建 适用 的 元 数据 ”采用 或 创建 符合 项 目 数 据 研究 要 求 的 元 数据 标准 ， 如 
方案 柏林 核心 集 、 文 本 编码 倡议 (TEI) 标准 、XML 等 
确保 数据 质量 对 数据 进行 监管 认证 ， 制 定 科学 有 效 的 质量 监管 流程 
提高 数据 可 解读 性 描述 数据 采集 方法 ， 解 释 数据 分 析 过 程 ， 给 出 辅助 解 
读 信息 
数据 存储 与 保存 ”选用 合适 的 数据 存储 格式 ”给 出 存储 的 数据 类 型 ， 选 用 当前 广泛 使 用 的 、 本 领域 
公认 的 最 佳 实践 格式 


描述 数据 存储 地 点 与 条 件 ”依据 数据 规模 选择 存储 地 点 ， 明 确 是 否 需 要 将 数据 存 
储 于 特定 环境 中 
制定 完善 的 数据 备份 计划 ”考虑 备份 频率 ， 明 确 备份 责任 人 ， 制 定 备 份 流程 ， 给 
出 备份 地 点 与 保护 方案 
明确 数据 管理 责任 人 指明 数据 管理 责任 人 ， 给 出 数据 使 用 许可 协议 、 使 用 
限制 、 保 密 性 或 相关 隐私 问题 的 处 理 方案 
指明 数据 保存 期 限 针对 不 同类 型 数据 采用 相应 的 保存 期 限 ， 适 时 进行 数 
据 更 新 、 迁 移 与 清理 
数据 共享 与 传播 进行 广泛 的 数据 共享 明确 是 否 进行 数据 共享 ， 与 何人 、 在 何 种 条 件 下 共享 
以 及 共享 时 可 能 会 遇 到 的 各 类 问题 
管理 数据 访问 权限 介绍 何人 拥有 访问 权限 ， 以 及 如 何 进 行 权 限 管 理 
处 理 伦理 及 隐私 问题 提供 隐私 保护 方案 ， 如 数据 加 密 、 匿 名 化 等 ， 处 理 知 
情 同 意 与 信息 泄露 风险 


本 文通 过 对 国外 典型 科研 资助 机 构 DMP 政策 的 调研 分 析 ， 一 方面 有 助 于 国内 科研 资助 机 构 加 深 对 
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DMP 政策 的 理解 ， 促 进 其 尽快 建立 和 完善 相关 的 政策 规定 ， 推 动 国内 数据 管理 实践 活动 的 开展 。 如 在 项 
目 申 请 阶段 便 明 确 要 求 申 请 者 提交 相应 的 DMP 文件 ， 并 在 项 目 中 期 与 完结 时 对 计划 实施 情况 进行 监督 、 
考核 ， 且 给 出 具体 的 奖惩 措施 等 。 男 一 方面 也 有 助 于 图 书馆 等 国内 科研 服务 机 构 更 好 地 把 握 DMP 的 内 涵 
实质 ， 领 悟 其 政策 要 领 ， 进 而 为 科研 人 员 提 供 更 具 针 对 性 的 数据 管理 服务 。 由 于 本 次 调研 分 析 的 对 象 局 限 
于 国外 若干 科研 资助 机 构 ， 因 而 在 国内 推广 应 用 其 DMP 政策 时 ， 各 机 构 还 需 结合 自身 的 实际 情况 ， 考 虑 
具体 的 应 用 情境 ， 对 上 述 政策 进行 针对 性 的 选用 。 此 外 ， 在 国外 DMP 政策 内 容 的 基础 上 ， 在 科研 数据 的 
整个 生命 周期 中 处 理 各 利益 相关 方 的 数据 权益 关系 时 ， 国 内 科研 资助 机 构 还 需 对 数据 管理 的 具体 模式 进行 
实地 考察 ， 包 括 对 科研 人 员 、 图 书馆 员 、 学 科 馆 员 等 进行 访谈 调研 等 ， 并 在 进一步 结合 其 他 相关 数据 政策 
的 基础 上 ， 制 定 出 契合 实际 、 符 合 我 国 国情 的 数据 管理 政策 。 同 时 ， 我 国 科研 服务 机 构 ， 如 图 书馆 、 信 息 
中 心 等 也 应 及 时 跟 进 ， 密 切 关 注 国 内 外 数据 管理 政策 ， 尤 其 是 DMP 政策 的 最 新 理论 与 实践 进展 ， 针 对 科 
研 资助 机 构 的 具体 要 求 不 断 为 科研 人 员 开 发 新 的 服务 内 容 与 服务 项 目 ， 在 服务 科研 的 同时 推动 自身 发 展 。 
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